Анализ взаимосвязи признаков «Успеваемость» и
«социальное положение»
1.
Построить таблицу абсолютных частот:
Из таблицы
видна тенденция: лучшее социальное положение сопровождается лучшей
успеваемостью, т.е. по-видимому есть зависимость между Успеваемостью и
Социальным положением
2. Исследовать выявленную зависимость более
подробно можно, если сравнить ожидаемые и наблюдаемые частоты:
В таблице
выделятся области, в которых доминируют две разные тенденции: либо 1) ожидаемые
частоты меньше наблюдаемых, либо
2) ожидаемые частоты больше
наблюдаемых частот. Эти результаты можно объединить в таблицу*:
Таблица 1
Успеваемость |
Социальное
положение |
|
Очень хорошее, хорошее, среднее |
Удовлетворительное, неудовлетворительное, плохое |
|
Очень
хорошо, хорошо, средне |
абс. частота > ожидаемой частоты |
абс. частота < ожидаемой
частоты |
Удовлетворительно,
неудовлетворительно, плохо |
абс. частота < ожидаемой частоты |
абс. частота > ожидаемой частоты |
* в некоторых ячейках выделенных блоков зависимости
немного нарушаются, но поскольку величины
нарушений незначительны, их можно отнести за счет статистических
погрешностей
Эта таблица
показывает, что чаще наблюдаются пары: хорошая успеваемость – хорошее
социальное положение, и плохая успеваемость – плохое социальное положение
3. Чтобы узнать, насколько значения абсолютных
частот важны по отношению к общему количеству, необходимо определить их
процентную долю, т.е. построить процентные таблицы сопряженности. В данном
примере все три вида процентов (по строкам, по столбцам и общие) сведены в одну
таблицу, но они могут быть рассчитаны в отдельных таблицах):
Каждую ячейку
данной таблицы можно проинтерпретировать по отдельности. Например, значения из
1-ой ячейки можно проинтерпретировать так:
¨
Один
студент их 2-х студентов-респондентов или 50% от студентов с очень хорошей успеваемостью
охарактеризовали свое социальное положение как очень хорошее
¨
Из 11
студентов с очень хорошим социальным положением 1 студент с очень хорошей
успеваемостью, что составляет 9,1%
¨
1 студент
с очень хорошей успеваемостью охарактеризовал свое социальное положение как
очень хорошее, что составляет 0,9% от всей таблицы
В целом по всей
таблице можно выделить несколько областей, которые характеризуются сходными
процентными соотношениями. В примере эти области выделены разным цветом.
Поэтому дальнейший анализ должен быть связан с группировкой соседних признаков
(в соответсвии с выделенными областями:
Таблица 2
Успеваемость |
Социальное
положение |
|
Очень
хорошо, хорошо, средне |
Очень хорошее, хорошее,
среднее |
Удовлетворительное,
неудовлетворительное, плохое |
Удовлетворительно,
неудовлетворительно |
Очень хорошее, хорошее,
среднее |
Удовлетворительное,
неудовлетворительное, плохое |
Плохо |
Очень хорошее, хорошее,
среднее |
Удовлетворительное,
неудовлетворительное, плохое |
В данном случае
выделена позиция «плохая успеваемость» из-за специфического содержимого ячейки
«плохая успеваемость – среднее социальное положение». Но поскольку в эту ячейку
попал только один респондент, то ее выделение не даст статистически значимых результатов,
поэтому целесообразнее остановиться на варианте из таблицы 1.
4. Группировка данных
- построить новую переменную социал_груп
с кодами*:
код |
Значение
исходной переменной «Социальное
положение» |
1 |
Очень хорошее,
хорошее, среднее |
2 |
Удовлетворительное,
неудовлетворительное, плохое |
0 |
Нет данных |
* первым нужно задать код 0 для всех значений
новой переменной
- построить
новую переменную успев_груп с кодами:
код |
Значение
исходной переменной «Успеваемость» |
1 |
Очень хорошо,
хорошо, средне |
2 |
Удовлетворительно,
неудовлетворительно, плохо |
0 |
Нет данных |
- провести
частотный анализ новых переменных
-
проанализировать взаимосвязь двух новых переменных:
Анализ
данной таблицы показывает:
¨
52
студента или 91,2% с хорошей успеваемостью охарактеризовали свое социальное
положение как хорошее
¨
из 67
студентов с хорошим социальным положением 52 студента имеют хорошую
успеваемость, что составляет 77,6%
¨
35
студентов или 70% с плохой успеваемостью охарактеризовали свое социальное
положение как плохое
¨
из 40
студентов с плохим социальным положением 35 студентов имеют плохую
успеваемость, что составляет 87,5%.
¨
Значение
коэффициента Юла = 0,92 (рассчитан в Excel) указывает на очень сильную взаимосвязь между
хорошей и плохой успеваемостью и хорошим и плохим социальным положением
5. Теперь необходимо
установить, какие именно студенты (пол,
возраст и прочие характеристики) образуют выделенные группы.
Для этого
необходимо провести частотный анализ отдельно по каждой из целевых групп, т.е. по двум группам
успеваемости.
1)
Для этого
необходимо произвести группировку файла по переменной усп_груп
2)
Провести
частотный анализ по анализируемым переменным, например по переменной пол
для расщепленного файла:
Из этой
таблицы видно, что хорошая
успеваемость больше характерна для мужчин (хорошо успевают 68,4% мужчин, и
31,6% женщин), а плохая успеваемость – для женщин (успевают плохо 53,1% женщин
и 46,9% мужчин)
3) Теперь необходимо выяснить, влияет ли
социальное положение на различия в успеваемости по полу, для чего необходимо
провести анализ взаимосвязей признаков пол и соц_груп каждой
группы с различной успеваемость:
Интерпретацию
этой таблице дать самостоятельно